心理 


学 报 2020, 


Acta Psychologica Sinica 


@ 2020 中 国 


Vol. 52, No. 10, 1199-1211 


心理 学 会 


https://dx.doi.org/10.3724/SP.J.1041.2020.01199 


0 


fü 
密切 相关 , 但 


频段 (4~8 Hz) 的 活动 反映 了 汉语 口语 
产生 中 音节 信息 的 加 工 - 
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(中 国人 民 大 学 心理 学 系 , 北京 100872) 


要 大 脑 的 神经 振荡 往往 反映 了 人 类 的 各 种 认 知 活动 。 语 言 理解 的 研究 发 现 大 脑 9 频段 的 活动 与 音节 的 加 工 


目前 尚未 有 研究 者 探究 语言 产生 过 程 中 大 脑 特定 频段 活动 与 音节 加 工 的 联系 。 我 们 通过 EEG 时 频 分 


HER, AJ 


HOWE ORE, 考察 了 23 名 健康 被 试 在 图 片 命名 过 程 中 0 频段 的 活动 与 音节 加 工 过 程 的 关系 。 行 为 
结果 发 现 ， 当 启动 词 和 目 


标 图 名 称 之 间 存 在 音节 相关 时 , 个 体 的 命名 反应 时 快 于 音节 无 关 的 条 件 ， 而 音素 相关 条 
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件 的 命名 反应 时 慢 于 音素 无 关 条 件 。 时 频 结 果 发 现 , 在 刺激 出 现 后 的 


270-460 ms， 音 节 相 关 条 件 下 个 体 0 频段 神 


经 振荡 的 能 量 显著 低 于 音节 无 关 条 件 ,音素 相关 与 音素 无 关 之 间 无 显著 差异 。 综 上 , 我 们 认为 汉语 


口语 产生 中 大 脑 


6 频段 的 活动 反映 了 对 音节 的 加 工 , 从 神经 振荡 指标 上 为 音节 是 汉语 


关键 词 ”口语 产生 ; 音节 ; 6 频段 ; 时 频 分 析 
分 类 号 B845 
1 引言 


口语 产生 是 指 将 思想 通过 发 音 带 官 进行 表达 
的 过 程 ( 张 清 芳 , 杨 玉 芳 ，2003b), 通常 经 历 松 念 化 
(conceptualization) .言语 组 织 (formulation) 以 及 发 音 
运动 (articulation) 三 个 阶段 。 首先 , 讲话 者 需要 在 概 
念 层面 明确 自己 想 要 表达 的 内 容 ， 其次, 对 特定 的 
概念 信息 进行 组 织 并 建立 相应 的 发 音 运动 程序 ， 包 
括 词 条 选择 (exical selectiom)， 词 素 音 位 编码 
encoding), 音韵 编码 
(phonological encoding) 以 及 语音 编码 (phonetic 
encoding)。 最 后 ,通过 声带 运动 将 发 音 目 标 以 声音 
的 形式 输出 (Levelt, Roelofs, & Meyer, 1999; Roelofs, 


(morphophonological 


口语 词汇 产生 中 音韵 编码 的 单元 提供 了 证 据 。 


中 发 生 的 语 误 现 象 主要 为 音素 遗漏 或 音素 蔡 换 。 采 
用 内 隐 启 动 范式 , 研究 者 发 现 连续 命名 首 音 素 相 同 
的 目标 词 (例如 cible-cintre-cerf), 其 反应 时 快 于 首 
音素 不 同 的 条 件 ， 出现 了 首 音素 促 进 效 应 (Alario， 
Perre, Castel, & Ziegler, 2007; Damian & Bowers, 
2003; Jacobs & Dell, 2014; Meyer, 1991)。 采 用 形容 
词 - 名 词 命 名 任务 , Damian 与 Dumay (2007) 发 现 被 
试 命名 首 音 素 相同 的 词 对 (例如 green goat) 快 于 首 
音素 不 同 的 词 对 (例如 green rug). 53b, 利用 图 词 
干扰 范式 (Damian & Martin, 1999) 与 掩蔽 启动 范式 
(Forster & Davis, 1991; Schiller, 2008), 研究 者 都 发 
现 了 首 音素 促进 效应 。 

然而 , 研究 表明 汉语 口语 产生 中 的 音韵 编码 单 


1997)。 音 韵 编码 阶段 的 加 工 单元 是 口语 产生 研究 

的 争论 焦点 之 一 。 

1.1 口语 产生 中 音韵 编码 单元 的 跨 语言 差异 
研究 表明 印 欧 语系 中 音素 是 音韵 编码 阶段 首 

先 被 提取 的 加 工 单元 。Dell (1986) 发 现在 字母 语言 
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元 是 音节 而 非 音 素 。 汉语 中 的 语 误 现象 主要 为 音节 
交换 错误 (Chen, 2000)。Chen, Chen 和 Dell (2002) 
采用 内 隐 启 动 范 式 , 发 现 音节 同 质 条 件 比 音节 蜡 质 
条 件 的 命名 反应 时 更 短 , 但 音素 同 质 条 件 与 音素 异 
质 条 件 之 间 无 显著 差异 。 利 用 掩蔽 启动 范式 (Chen， 
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O'Seaghdha, & Chen, 2016) 和 图 词 干扰 范式 ( 张 清 芳 ， 
BEF, 2005), 人 研究 者 发 现 了 相同 模式 的 结果 。 岳 
源 和 张 清 芳 (2015) 结 合 图 词 干扰 范式 与 不 同 的 实验 
任务 (即时 命名 ,， 延 时 命名 ， 延 时 命名 与 发 音 抑制 
相 结合 )， 发 现 音 节 促 进 效应 发 生 在 音韵 编码 阶段 ， 
并 且 该 促进 作用 是 一 个 稳定 可 靠 的 效应 (Cohen d = 
0.85 > 0.8) (Cohen, 1988)。 上 述 研 究 结果 一 致 地 表 
明 音 节 是 汉语 口语 词汇 产生 中 音韵 编码 阶段 最 先 
被 提取 的 单元 。 

根据 跨 语言 研究 的 不 同 结果 ，O’Seaghdha， 
Chen 和 Chen (2010) 提 出 了 有 关 音 韵 编码 的 合适 单 
元 假说 (proximate units principle)。 合 适 编 码 单元 
(proximate units) 指 的 是 激活 词汇 词素 之 后 首先 被 
加 工 的 音韵 编码 单元 ， 最 先 选择 的 单元 存在 语言 上 
的 差异 : 印 欧 语系 如 英语 或 荷兰 语 中 最 先 选 择 的 单 
元 是 音素 ， 而 在 汉语 中 则 为 音节 。 在 印 欧 语系 中 ， 
讲话 者 在 选择 音素 后 ， 结 合 节律 信息 进行 音节 化 过 
程 ， 从 心理 音节 表 中 提取 音节 准备 发 音 运 动 程序 。 
汉语 口语 产生 中 讲话 者 在 选择 音节 后 进一步 分 解 
为 音素 或 音 段 信息 (音韵 编码 )， 准 备 发 音 运动 程序 
(语音 编码 )， 最 后 进行 发 音 , 输出 口语 产生 的 结 
(发 音 运 动 ) ( 同 见 Roelofs, 2015). 

音韵 编码 单元 的 跨 语 言 差异 与 不 同 语言 各 自 
的 特点 密切 相关 。 在 汉语 中 , 音节 是 受 具 体 语言 的 
语义 和 结构 制约 的 最 小 自然 发 音 单位 ,对 口语 产生 
具有 重要 意义 ( 张 清 芳 , 2005)。 一 方面 , 汉语 的 音节 
数量 远 远 低 于 其 他 字母 语言 ( 张 清 芳 , WR, 
2005), 另 一 方面 ,汉语 的 音节 边界 相对 清晰 , 不 存 
在 字母 语言 中 重新 音节 化 的 现象 。 因 此 ， 对 汉语 而 
言 ， 更 加 经 济 高 效 的 加 工 方式 是 将 词 条 的 音节 信息 


200-400 ms (音韵 编码 ) 以 及 400-600 ms (语音 编 
码 ); 采用 掩蔽 启动 范式 , Zhang 和 Damian (2019) 发 
现在 目标 图 呈现 后 的 300~400 ms (音韵 编码 )， 音节 
相关 条 件 诱发 了 更 小 的 ERP 波幅 。 虽 然 ERP 能 够 
区 分 不 同 实验 效应 的 时 间 进 程 , 但 上 述 研 究 都 忽视 
了 口语 产生 过 程 中 的 神经 振荡 活动 (neural 
oscillations)。 传 统 的 ERP 分 析 是 对 相同 实验 条 件 下 
的 神经 信号 进行 二 加 平均 (Rugg & Coles, 1995)。 然 
m, 脑 电 信号 在 经 过 多 次 大 加 后 , 会 减弱 甚至 消除 
非 相 位 锁定 的 神经 振荡 活动 (Bidelman, 2015)。 本 研 
究 拟 采用 脑 电 时 频 分 析 探 索 汉语 母语 者 音韵 编码 
加 工 过 程 中 神经 振荡 的 特点 ,特别 关注 的 是 对 应 于 
音节 和 音素 效应 的 神经 振荡 。 
1.20 0 频段 (4~8 Hz) 神 经 振荡 与 音节 加 工 之 间 的 

神经 振荡 被 认为 是 大 脑 神经 元 的 节律 性 反应 ， 
包括 了 delta (6, < 4 Hz), theta (0, 4~8 Hz), alpha (a, 
8~13 Hz), beta (B, 13~30 Hz), gamma (y, > 30 Hz) 
等 频段 (Ward，2003)。 研 究 表明 神经 振荡 与 个 体 的 
注意 、 记 忆 、 决 策 等 认 知 过 程 有 着 密切 的 联系 (Fell 
& Axmacher, 2011; Jensen, Kaiser, & Lachaux, 2007; 
Klimesch, 2012; Siegel, Donner, & Engel, 2012). A 
类 的 语言 活动 同样 会 引发 特定 频段 的 神经 振荡 
(Giraud & Poeppel, 2012; Lewis, Wang, & Bastiaansen, 
2015)。 例 如 ， 当 被 试 加 工 存在 句法 错误 的 材料 时 ， 
大 脑 B 频段 的 神经 振荡 能 量 会 显著 降低 (Bastiaansen， 
Magyari, & Hagoort, 2009)。 

针对 语音 信息 加 工 的 认 知 神经 机 制 , 不 对 称 时 
间 采 样 理论 (asymmetric sampling in time, AST) 提 出 
大 脑 的 听觉 腹 侧 通路 (里 上 回 STG—380 E STS 一 


储存 在 长 时 记忆 中 ,并 在 音韵 编码 的 早期 进行 直接 
提取 。 而 在 印 欧 语系 中 ,音节 的 数量 巨大 , 在 发 音 
过 程 中 存在 大 量 重新 音节 化 的 现象 (Levelt et al., 
1999)， 因 此 ， 讲 话 者 在 音韵 编码 阶段 首先 提取 的 
加 工 单元 是 音素 。 

人 研究 者 采用 事件 相关 电位 (event-related 
potential，ERP) 技 术 对 该 问题 进行 了 研究 Qu, 
Damian 和 Kazanina (2012) 采 用 首 音 素 重 复 范 式 ( 如 
首 音 素 重 复 的 “ 黄 盒 子 ” 和 首 音素 不 重复 的 “ 绿 盒 
P), 在 图 画 呈 现 后 的 200~300 ms 之 间 发 现 了 首 音 
素 重 复 效应 ,表明 音素 信息 在 音韵 编码 阶段 也 会 被 
激活 ( 同 见 Yu Mo, & Mo, 2014)。 利 用 图 图 干扰 范 
式 和 延迟 图 画 命名 任务 ，Wang，Wong，Wang 与 
Chen (2017) 发 现 音节 效应 发 生 在 目标 图 呈现 后 的 


X RJ ITS) 将 按照 刺激 的 声学 属性 进一步 分 化 成 
两 条 平行 的 加 工 通路 ,分 别 负责 提取 音节 和 音素 水 
平 的 信息 (Poeppel, 2003)。 一 段 连续 语 流 中 所 包含 
的 音节 信息 在 时 程 上 的 变化 速率 相对 音素 而 言 是 
比较 缓慢 的 ， 而 大 脑 低 频 的 9 活动 则 表征 了 对 音节 
的 加 工 (Doelling, Arnal, Ghitza, & Poeppel, 2014; 
Howard & Poeppel, 2012; Luo & Poppel, 2007; 
Peelle, Gross, & Davis, 2013), 虽然 大 脑 神经 元 的 放 
电 频 率 和 语音 信号 自身 的 音节 变化 频率 不 是 简单 
的 直接 对 应 关系 , 但 这 仍然 提示 我 们 0 频段 的 神经 
振荡 活动 与 音节 的 加 工 紧密 相关 。 

第 一 , 大 脑 9 活动 的 相位 信息 表征 了 对 音节 的 
追踪 (Ghinst et al., 2016; Gross et al., 2013; Molinaro, 


Lizarazu, Lallier, Bourguignon, & Carreiras, 2016). 
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在 Pefkou, Arnal, Fontolan 和 Giraud (2017) 的 实验 中 ， 
研究 者 首先 对 人 们 自然 状态 下 产生 的 实验 材料 (名 
子 ) 音 频 进 行 包 络 分 析 , 得 到 该 声音 信号 中 所 包含 
的 音节 总 数 ， 再 将 其 除 以 自身 的 总 持续 时 间 , 计算 
出 这 段 音频 的 音节 速率 , 最 后 通过 对 材料 进行 时 程 
上 的 压缩 ， 以 获得 不 同音 节 速 率 的 实验 刺激 。 进 入 
正式 实验 后 ， 主 试 在 记录 被 试 脑 电信 号 的 同时 ， 向 
被 试播 放 不 同音 节 速 率 的 句子 .回归 分 析 结 果 发 现 ， 
个 体 的 6 相位 一 致 性 随 着 音节 速率 的 升 高 而 降低 ， 
也 就 是 说 ， 当 句子 的 播放 速度 越 快 , 被 试 越 难 追踪 
其 中 的 音节 信息 时 ,大脑 6 活动 的 相位 一 致 性 就 越 
差 。 此 外 ,研究 发 现 当 被 试 接受 连续 的 音节 序列 
(syllable sequences) 刺 激 时 , 0 神经 振荡 的 相位 一 致 
性 会 提高 (Power Mead, Barnes, & Goswami, 2012). 

第 二 , 大 脑 9 活动 的 能 量 信息 反映 了 对 音节 的 
识别 。 在 一 项 跨 语 言 的 研究 中 ,Pefia 和 Melloni 
(2012) 采 用 日 语 , 西班牙 语 ， 意大利 语 三 种 不 同 语 
言 的 口语 句子 作为 实验 材料 考察 西班牙 语 母 语 者 
和 意大利 语 母语 者 语言 理解 的 动态 过 程 。 结 果 发 现 
不 管 是 哪 种 母语 类 型 的 被 试 ， 当 听 到 正 序 播放 的 名 
子 时 , 0 频段 神经 振荡 的 能 量 显 著 高 于 逆序 播放 各 
子 的 条 件 。 并 且 ， 当 被 试听 非 本 国语 的 材料 时 ， 对 
比 正 序 播放 和 逆序 播放 两 种 实验 条 件 ,，6 频段 的 能 
量 活动 表现 出 加 工本 国语 言 材料 时 相同 的 模式 。 正 
序 播放 和 逆序 播放 的 材料 虽然 保持 了 基本 声学 属 
性 的 高 度 一 致 ,但 倒 放 的 材料 会 造成 严重 的 语音 扭 
Hi (phonological distortions)， 导 致 个 体 无 法 理解 材 
料 的 意义 (Binder et al., 2000; Gross et al., 2013; 
Saur et al., 2010)。Pefia 和 Melloni (2012) 指 出 ， 实 
验 材 料 在 时 程 上 的 反 向 破坏 了 各 个 单词 原 有 的 语 
音 结 构 ， 造 成 个 体 难 以 切 分 单词 的 音节 ， 从 而 使 个 
体 9 频段 的 神经 振荡 活动 变 弱 。 在 一 项 关于 汉语 的 
人 研究 中 ， 当 研究 者 向 被 试播 放 音节 刺激 时 ,， 正 放 的 
条 件 相 比 于 倒 放 的 条 件 同样 诱发 了 更 强 的 6 频段 能 
量 活 动 (Ding, Melloni, Zhang, Tian, & Poeppel, 
2015). 

综 上 , 行为 和 ERP 人 研究 均 表明 音节 在 汉语 口 
语 产 生 过 程 中 扮演 了 重要 角色 , 语言 知觉 或 理解 的 
研究 表明 9 频段 的 神经 活动 与 音节 加 工 密切 相关 。 
目前 尚未 有 研究 考察 汉语 口语 产生 中 的 音节 启动 
效应 是 否 与 特定 频段 的 神经 振荡 活动 相关 ， 而 脑 电 
时 频 分 析 有 助 于 我 们 更 深入 地 了 人 解 汉语 口语 产生 
过 程 中 对 于 音节 的 加 工 机 制 。 本 研究 中 我 们 采用 掩 
蔽 启动 范式 ， 操 纵 启 动词 和 目标 图 名 称 之 间 的 语音 


相关 关系 (音节 相关 -音节 无 关 ,， 音 素 相 关 - 音 素 无 
关 )， 要 求 被 试 完成 图 画 命 名 任务 ， 同 时 记录 其 脑 
电信 号 , 最 后 对 EEG 数据 进行 时 频 分 析 ， 考察 音节 
效应 和 音素 效应 发 生 时 的 神经 振荡 。 在 掩蔽 启动 范 
式 中 , 启动 词 的 呈现 时 间 非 常 短 (50 ms 左右 ), 被 试 
对 局 动 刺激 的 加 工 通常 是 浆 下 的 ,该 范式 排除 了 个 
体 命 名 策略 等 无 关 因 素 对 实验 结果 的 影响 (Chen et 
al., 2016; You, Zhang, & Verdonschot, 2012)。 由 于 0 
频段 和 音节 的 加 工 存 在 密切 联系 (Ghinst et al., 2016; 
Gross et al, 2013; Power et al, 2012; Pefia & 
Melloni，2012)， 我 们 预期 会 发 现 显著 的 音节 启动 
效应 , 但 不 会 发 现 显 著 的 音素 启动 效应 ,相应 地 ，0 
频段 的 能 量 仅 在 音节 相关 和 无 关 条 件 中 会 存在 显 
BEF o 


2 方法 
24 被 试 


23 名 大 学 生 和 研究 生 (11 名 男生 , 平均 年 龄 22 
岁 )。 所 有 被 试 均 为 右 利 手 , 无 任何 精神 疾病 病史 ， 
母语 为 汉语 ， 讲 标准 普通 话 ， 视 力 或 矫正 视力 正 
常 。 在 参加 实验 之 前 被 试 阅 读 知 情 同意 书 并 签字 ， 
实验 之 后 获得 一 定 报酬 
2.2 ”材料 

64 幅 由 黑白 线条 组 成 的 图 片 ， 选 自 张 清 芳 和 
杨 玉 芳 (2003a) 建 立 的 汉语 图 片 库 ， 其 中 用 于 正式 
实验 的 图 片 60 幅 , 练习 试 次 图 片 4 幅 。 每 张 图 片 的 
名 称 为 双 音 节 名 词 ， 第 一 个 字 分 别 与 4 种 实验 条 件 
匹配 。 例 如 ,图片 名 称 为 鼻子”(Wbi2ziS/)， 音 节 相 
关 条 件 的 启动 字 为 “ 彼 ”(bi3/), 与 图 片 名 称 音节 完 
全 相同 但 声调 不 同 ; 音素 相关 条 件 的 启动 字 为 “ 柏 ” 
(/bai3/), 与 图 片 名称 的 首 音素 相同 ,声调 不 同 。 音 
节 相 关 与 音素 相关 的 条 件 下 启动 词 的 词 频 (Cai & 
Brysbaert，2010) 没 有 显著 差异 (t = 0.027, p = 
0.978)。 音 节 相 关 条 件 与 音素 相关 条 件 的 启动 字 在 
随机 打 乱 后 重新 与 图 片 进行 匹配 形成 音节 无 关 条 
件 与 音素 无 关 条 件 。 检 查 后 ， 两 种 无 关 条 件 下 的 启 
动 字 与 目标 图 名 称 之 间 不 存在 语音 相关 。4 种 实验 
条 件 下 启动 词 和 图 片 名 称 之 间 不 存在 语义 和 正字 
法 相关 。 

2.3 设计 

研究 采用 2x2x2 被 试 内 设计 ， 自 变量 包括 相关 
类 型 (音节 ,音素 )、 相 关 条 件 (相关 ， 无 关 ) 和 重复 次 
数 (第 一 次 , 第 二 次 )。 每 幅 图 片 与 4 种 不 同类 型 启 
动 字 匹配 ， 因 此 每 组 测试 中 包括 了 240 个 试 次 。 每 
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组 测试 重复 两 次 ， 因 此 每 个 被 试 共 完 成 480 个 试 
次 。 每 个 被 试 在 每 组 测试 中 的 试 次 呈现 顺序 都 是 不 
同 的 , 通过 伪 随 机 的 方式 呈现 ， 保 证 相同 的 图 片 之 
间 至 少 间隔 5 个 试 次 , 图 片 名 称 首 音 素 相 同 的 试 次 
不 会 连续 出 现 。 
2.4 ”实验 仪器 

E-prime 2.0 编写 实验 程序 , PST SRBOX 反应 
fx, 麦克 风 与 计算 机 。 实 验 图 片 均 通 过 计算 机 呈现 
在 屏幕 中 央 , 被 试 的 反应 通过 反应 盒 连 接 的 麦克 风 
记录 。 实验 材料 的 呈现 和 被 试 的 反应 时 由 电脑 控制 
与 收集 。 主 试 记 录 被 试 是 否 进 行 正确 反应 。 采 用 国 
际 通用 10-20 系统 的 64 导 脑 电 帽 ， NeuroScan 系统 
记录 被 试 的 脑 电信 号 。 
2.5 ”程序 

实验 分 为 3 个 阶段 , 学 习 阶 段 、 测 试 阶段 和 正 
式 实验 阶段 。 在 学 习 阶 段 ， 屏幕 中 央 会 依次 呈现 每 
幅 图 片 及 其 对 应 的 名 称 2 s。 主 试 告知 被 试 接 下 来 
正式 实验 中 会 出 现 这 些 图 片 并 要 求 被 试 记 住 图 片 
的 内 容 及 其 对 应 的 名 称 。 在 测试 阶段 ， 呈 现 图 片 要 
求 被 试 说 出 图 片 名 称 ， 当 被 试 对 所 有 图 片 都 能 正确 
命名 时 , 方 可 进入 正式 实验 。 所 有 材料 都 是 日 常生 
活 中 常见 的 且 命 名 一 致 性 较 高 的 图 片 , 所 有 被 试 均 
能 顺利 完成 对 图 片 名 称 的 学 习 。 

正式 实验 中 每 个 试 次 的 流程 如 下 ( 见 图 1): E 
先 呈 现 500 ms 的 注视 点 (“+”), 然后 是 500 ms 的 前 掩 
K(@@), 接着 会 呈现 49 ms 的 启动 词 , 随后 是 20 ms 
WAERO), Tli). 屏幕 中 央 会 呈现 目标 
图 片 。 被 试 需要 在 2000 ms 内 又 快 又 准 地 对 图 片 进行 
命名 , 做 出 反应 的 同时 图 片 会 立刻 消失 , 间隔 1000 ms 
后 开始 下 一 次 测试 。 正 式 实验 之 前 有 4 次 练习 使 被 
试 熟 悉 实验 任务 。 所 有 的 图 片 刺激 均 标 准 化 为 统一 
大 小 , 启动 字 为 28 号 宋体 ,掩蔽 刺激 (@@) 为 36 号 
宋体 。 完 成 对 所 有 试 次 的 命名 需要 100 分 钟 。 
2.6 ” 脑 电 记录 与 分 析 

在 线 记 录 以 左 侧 乳 突 作 为 参考 电极 ,离线 分 析 


1000 ms 


图 1 掩蔽 启动 范式 实验 流程 


时 重 参 考 为 双 侧 乳 突 。 同 时 记录 双眼 的 水 平 眼 电 
(HEOG) 和 左 眼 的 垂直 眼 电 (VEOG)。 电 极 与 头皮 之 
间 的 阻抗 均 小 于 5 kQ, 滤波 带 通 为 0.05~70 Hz, fri 
号 采样 率 为 500 Hz. 

预 处 理 采 用 EEGLAB 工具 包 进 行 (Delorme & 
Makeig, 2004)。 首 先 ， 对 于 信号 采集 时 与 头 部 接触 
不 良 或 已 损坏 的 电极 (数量 未 超过 总 电极 数 的 596), 
采用 EEGLAB 中 自 带 函数 进行 坏 导 替换 , 通过 “ 球 
面 插值 算法 ”(spherical interpolation), 利用 被 替换 
导 联 周围 电极 的 数据 ， 对 信和 号 重新 估计 后 进行 替换 
(Perrin, Pernier, Bertrand, & Echallier, 1989; Pivik et 
al.，1993)。 第 二 ， 对 数据 进行 0.1~30 Hz 的 滤波 以 
及 独立 成 分 分 析 (independent component analysis， 
ICA). ICA 基于 盲 源 信号 分 离 技术 ,基本 思路 是 将 
多 通道 观察 的 信号 按照 统计 独立 的 原则 分 解 为 车 
干 成 分 (Cs)。ICA 对 脑 电 信号 中 由 于 肯 眼 ， 肌 肉 运 
动 引 发 的 伪 迹 有 和 较 高 的 识别 度 (Makeig，Bell, Jung, 
& Sejnowski, 1995)。 眼 电 伪 迹 的 判断 标准 为 : 成 分 
排序 靠 前 ,成 分 的 头 部 活动 集中 在 前 额 区 ， 能量 
动 随 频率 升 高 缓慢 衰减 ， 单 试 次 能 量 大 。 肌 电 伪 迹 
的 判断 标准 为 : 成 分 的 头 部 活动 分 散在 外 侧 的 局 部 
地 区 ,能 量 活动 随 频 率 升 高 而 升 高 ， 单 试 次 能 量 较 
大 。 按 上 述 标准 对 每 个 成 分 依次 进行 检查 ,并 结合 
EEGLAB 识别 伪 迹 成 分 的 插件 ADJUST, 对 伪 迹 进 
行 排除 。 第 三 , 按 图 片 出 现 前 1000 ms 以 及 出 现 后 
1500 ms 对 脑 电信 号 进行 分 段 , 在 排除 波幅 超过 + 
100 uV 的 试 次 以 及 肉眼 确认 后 ,将 数据 保存 。 

利用 Fieldtrip 工具 包 对 数据 进行 时 频 分 析 , D 
用 小 波 变 换 的 方法 (Oostenveld, Fries, Maris, & 
Schoffelen, 2011)。 单 试 次 总 时 长 为 2500 ms, 时 间 
分 状 率 为 10 ms; 分 析 频 段 范 围 为 3~30 Hz, 频率 分 
BESSON 1 Hz。 小 波 周 期 以 线性 方式 递增 ， 最 低频 率 
处 周期 为 3， 最 高 频率 处 周期 为 8 (同样 的 标准 见 Li, 
Shao, Xia, & Xu, 2019)。 随 后 将 不 同 周 期 的 正弦 小 
波 与 脑 电 时 域 信 号 进行 卷 积 ， 进 而 获得 不 同 频率 范 
围 内 各 个 时 间 点 脑 电信 号 的 神经 振荡 能 量 
(Goupillaud, Grossmann, & Morlet, 1984)。 分 析 过 程 
中 首先 对 单个 试 次 的 活动 能 量 进行 估计 ， 再 完成 多 
试 次 之 间 的 平均 。 以 刺激 出 现 前 300-100 ms 作为 
基线 , 采用 分 贝 量 尺 对 能 量 活动 进行 校正 : dB = 10 
x log10 (基线 后 能 量 /基线 平均 能 量 )。 简明 起 见 , 事 
件 相关 频谱 扰动 (event-related spectral perturbation, 
ERSP) 呈 现 的 频率 范围 为 4~20 Hz. 

根据 电极 点 分 布 的 空间 位 置 , 研究 选取 了 6 个 
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兴趣 区 (regions of interest, ROD) 并 对 每 个 兴趣 区 内 
的 神经 振荡 能 量 进行 平均 , 分 别 为 : 左前 区 (F3， 
FC3, FC5)， 中 前 区 (Fz, FCz, Cz), 右前 区 (F4, FC4, 
FC6), 左 后 区 (P5, P3, PO3), 中 后 区 (CPz, Pz, POZ) 
与 右 后 区 (P6, P4, PO4)。 采用 2( 相 关 类 型 : 音节 , 音 
素 ) x 2( 相 关 条 件 : 相关, FOR) x 2( 重 复 : 第 一 次 ， 
第 二 次 ) x 6( 兴 趣 区 : Zen, PHY, AAT, Æ, P 
Ja, 右 后 ) 重 复 测量 方差 分 析 , 统计 结果 非 球 形 性 
时 利用 Greenhouse-Geisser 法 对 p 值 进行 校正 。 

在 比较 音节 相关 和 无 关 条 件 ， 音素 相关 和 无 关 
条 件 的 差异 是 否 显 著 时 ,我们 采用 了 基于 簇 的 置换 
检验 (cluster-based permutation test) 对 数据 进行 统计 
ANT, 该 方法 能 够 有 效 地 对 多 重 比 较 下 的 p 值 进 行 
校正 (Maris & Oostenveld, 2007)。 进 行 置换 检验 的 
时 间 窗 口 为 刺激 出 现 后 的 600 ms, 步 长 为 10 ms, 
FE 6 个 兴趣 区 ,对 感 兴趣 的 每 两 个 实验 条 件 之 间 的 
数据 (时 间 x 频 率 x 电 极 ) 进 行 重复 测量 t+ 检验,p 值 小 
于 0.05 且 在 时 间 和 空间 位 置 上 邻近 的 数据 点 将 被 
合并 为 同一 个 复 。 随 后 ， 计 算 每 个 复 内 上 值 的 和 以 
确定 簇 水 平 (cluster level) 的 统计 信息 ， 通 过 蒙特 卡 
洛 法 (Monte Carlo method) 进 行 统计 显著 性 检验 ， 
随机 抽样 的 次 数 为 1000 次 。 
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3.1 ”行为 结果 

删除 两 个 错误 率 大 于 10% 以 及 两 个 反应 时 均 
值 在 3 个 标准 差 之 外 的 项 目 。 删除 设备 未 记录 到 的 
数据 (2.5%) 以 及 命名 错误 的 数据 (1.8%)。 删 除 反 应 
时 小 于 200 ms 以 及 大 于 1500 ms 的 数据 包含 偏离 
平均 值 3 个 标准 差 之 外 的 数据 在 内 ， 占 总 试 次 的 
2.3%。 图 2 所 示 为 不 同 实验 条 件 变化 下 命名 反应 时 
(5935 (EL RII 95968 fri IX [HR] (confidence interval, Cl). 
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图 2 不 同 条 件 下 命名 反应 时 
注 : 误差 棒 为 95% CI, * p< 0.05, n.s. 表 示 无 显著 差异 


对 反应 时 数据 进行 2( 相 关 类 型 : 音节 ,音素 ) x 
2( 相 关 条 件 : HAE, 无关) x 2( 重 复 次 数 :第 一 次 , 第 
二 次 ) 重 复 测量 方差 分 析 , 被 试 分 析 (F1) 与 项 目 分 析 
CE)) 结 果 表 明 ， 相 关 类 型 的 主 效应 在 被 试 分 析 中 显 
著 , 项 目 分 析 中 边缘 显著 : 被 试 在 音节 条 件 下 的 命 
名 反应 时 更 快 , Fi(1, 22) = 7.67, p = 0.01, 03 = 0.26, 
F,(1, 55) = 3.46, p = 0.07, 5; = 0.06。 重 复 次 数 的 主 
效应 显著 : 被 试 在 第 二 次 重复 时 命名 反应 时 更 快 ， 
Fi(1, 22) = 48.24, p < 0.001, g = 0.69, FX(1, 55) = 
282.59, p < 0.001, 5? = 0.84。 相 关 类 型 和 相关 条 件 
的 交互 作用 显著 : Fi(1, 22) = 5.51, p = 0.03, j = 
0.20, Fs(1, 55) = 7.04, p = 0.01, 03 = 0.11。 简 单 效应 
分 析 表 明 ,， 被 试 在 音节 相关 条 件 下 命名 反应 时 显著 
快 于 音节 无 关 条 件 , Fi(1, 22) = 6.12, p = 0.02, ji = 
0.22, F2(1, 55) = 5.87, p = 0.02, 92 = 0.10; 音素 相关 
条 件 与 音素 无 关 条 件 之 间 命 名 反应 时 差异 不 显著 ， 
F,(1, 22) = 0.85, p = 0.37, 52 = 0.04, F(1, 55) = 1.45, 
p = 0.23, y; = 0.03。 相 关 类 型 ， 相 关 条 件 与 重复 次 
数 之 间 的 三 重 交 互 作用 在 被 试 分 析 中 显著 , 项 目 分 
析 中 边缘 显著 : Fi(1, 22) = 7.88, p = 0.01, y; = 0.26, 
F;(1, 55) = 3.75, p = 0.06, 52 = 0.06。 第 一 次 重复 时 ， 
相关 类 型 与 相关 条 件 的 交互 作用 显著 ，Fi(1，22) = 
13.38, p = 0.001, = 0.38，F2(1，55) = 853, p = 
0.005, y; = 0.13。 具 体 表 现 为 被 试 在 音节 相关 条 件 
下 命名 反应 时 显著 快 于 音节 无 关 条 件 , Fi(1,22) = 
5.88, p = 0.02, g2 = 0.21, F,(1, 55) = 6.01, p = 0.02, 
Np = 0.10; 而 音素 相关 条 件 的 命名 反应 时 显著 慢 于 
音素 无 关 条 件 , Fi(1, 22) = 5.04, p = 0.04, g? = 0.19, 
F,(1, 55) = 4.53, p = 0.04, 92 = 0.08。 第 二 次 重复 时 ， 
相关 类 型 与 相关 条 件 的 交互 作用 不 显著 , Fl < 1, Fy 
<1。 其 他 的 主 效 应 和 交互 作用 均 不 显著 。 

3.0 ”时 频 分 析 结 果 

一 名 被 试 由 于 信号 伪 迹 过 大 未 纳入 后 续 分 析 。 
删除 反应 时 小 于 500 ms (5.1%), 大 于 1500 ms 
(1.0%) 以 及 伪 迹 较 大 的 试 次 (5.3%)。 我 们 根据 相关 
人 研究 确定 了 6 个 连续 的 时 间 窗 口 : 0-100 ms, 
100~200 ms, 200~300 ms, 300~400 ms, 400~500 ms, 
500~600 ms (类 似 的 窗口 划分 见 Qu et al., 2012; 
Zhang & Damian, 2019)， 每 个 时 间 窗 口内 6 能 量 活 
动 方差 分 析 的 结果 见 表 1。 

在 0~100 ms, 100~200 ms 和 200~300 ms 时 间 
窗 内 ， 相 关 类 型 的 主 效应 显著 , 音节 条 件 诱发 了 更 
大 的 能 量 活动 , FC, 210-100 ms = 8.08, p = 0.01, 9; = 
0.28, F(1, 21)100-200 ms = 11.03, p = 0.003, g? = 0.35, 
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表 1 以 相关 条 件 、 相 关 类 型 、 重 复 次 数 以 及 兴趣 区 为 自 变量 0 能 量 活 动 在 0~600 ms 时 间 窗 内 的 方差 分 析 


. 0~100 ms 100~200 ms 200~300 ms 300~400 ms 400~500 ms 500~600 ms 
变异 来 源 = ; : = 5 
F Dp F F Dp F Dp F Dp F Dp 
相关 类 型 (1, 21) 8.08* 0.28 11.03** 0.35 5.18* 0.20 n.s. n.s. n.s. 
相关 条 件 (1, 21) n.s. n.s. n.s. n.s. n.s. n.s. 
重复 次 数 (1, 21) n.s. n.s n.s. n.s. n.s. n.s. 
相关 类 型 x 相关 条 件 (1, 21) n.s. n.s n.s. 5.13* 0.20 6.41* 0.23 6.00* 0.22 
相关 类 型 x 相 关 条 件 x 重 复 次 数 
n.s. n.s. n.s. n.s. n.s. n.s. 
(1, 21) 
相关 条 件 x 相 关 类 型 x 重 复 次 数 x 
n.s. n.s. n.s. n.s. n.s. n.s. 


兴趣 区 (5, 105) 


iE: **p<0.01,*p<0.05,n.s. 不 显著 。 


F(l, 21)200300 ms = 5.18, p = 0.03, y; = 0.20. 在 
300-400 ms 时 间 窗 内 ， 相 关 类 型 和 相关 条 件 的 交 
互 作用 显著 , FC, 21) = 5.13, p - 0.03, 95 = 0.20。 音 
节 相 关 条 件 的 平均 能 量 小 于 音节 无 关 条 件 , F(1, 21) 
= 443, p = 0.047, 5 = 0.17; 音素 相关 与 音素 无 关 
条 件 之 间 无 显著 差异 , p = 0.14。 在 400~500 ms 时 
间 窗 内 ， 相 关 类 型 和 相关 条 件 的 交互 作用 显著 , FC, 
21) =6.41, p = 0.02,03 = 0.23。 音 节 相 关 条 件 的 平均 
能 量 小 于 音节 无 关 条 件 , F(1, 21) = 5.81, p = 0.03, 
p; = 0.22; 音素 相关 与 音素 无 关 条 件 之 间 无 显著 差 
5, p = 0.38, TE 500—600 ms 时 间 窗 口内 ， 相 关 类 型 
和 相关 条 件 交 互 作用 显著 , F(1, 21) = 6.00, p = 0.02, 
n, = 0.22。 音 节 相 关 条 件 的 平均 能 量 小 于 音节 无 关 
条 件 (边缘 显著 ), F(1, 21) = 3.57, p = 0.07, gi = 0.15; 
音素 相关 与 音素 无 关 条 件 之 间 无 显著 差异 , p = 
0.16。 其 他 频段 的 能 量 活动 在 各 个 时 间 窗 内 的 交互 
作用 都 不 显著 。 

针对 音节 效应 和 音素 效应 所 进行 的 基于 徐 的 
置换 检验 结果 显示 ， 第 一 次 重复 时 ， 右 前 兴趣 区 


表 2 0-600 ms 之 间 各 频段 能 


(F4, FC4, FC6) 音 节 相 关 条 件 比 音节 无 关 条 件 在 刺 
激 出 现 后 的 270~460 ms 之 间 诱 发 了 更 低 的 9 频段 
能 量 活 动 (p = 0.01, 4~8 Hz); 左前 兴趣 区 (F3, FC3, 
FC5) 音 素 相 关 条 件 比 音素 无 关 条 件 在 刺激 出 现 后 
的 340~390 ms 诱发 了 更 高 的 0 频段 能 量 活动 (边缘 
显著 ,p = 0.052, 4~8 Hz)。 第 二 次 重复 时 ， 各 个 兴趣 
区 的 音节 效应 , 音素 效应 均 不 显 车。 在 3~30 Hz 之 
间 其 他 的 频段 (8,，a,B) 的 能 量 活动 上 , 感 兴趣 的 实 
验 条 件 之 间 差 异 不 显著 ( 见 表 2)。 图 3a 与 3b 分 别 
呈现 了 不 同 重 复 次 数 下 音节 效应 与 音素 效应 的 
ERSP。 


4 讨论 


本 研究 采用 掩蔽 启动 范式 考察 了 汉语 口语 产 
生 中 音节 与 音素 的 加 工 过 程 与 6 频段 能 量 活动 之 间 
的 关系 。 行 为 结果 发 现 个 体 在 音节 相关 条 件 下 对 图 
片 的 命名 快 于 音节 无 关 条 件 ， 而 在 音素 相关 条 件 下 
命名 反应 时 慢 于 音素 无 关 条 件 。 脑 电 时 频 分 析 结 
表明 , 在 图 片 出 现 后 的 270-460 ms, 0 频段 的 能 量 


im 


频段 能 量 活 动 的 音节 效应 与 音素 效应 


实验 效应 频段 0~300 ms 300~600 ms 
6, a, B n.s. n.s. 
音节 效应 0 i 270~300 ms : 300~460 ms 
重 | p=0.01 : bp =0.01 0.3 dB 
复 
ò, a, p n.s. n.s. 
音素 效应 0 340~390 mas 02 dB 
ud à!  p- 0.052 Su 
MEET 9, a, p n.s. n.s. 
重 音节 效应 
= n.s. n.s. 
Fh 
= FEE 6, a, B n.s. n.s. 
ET 音素 效应 
0 n.s. n.s. 


ne 
t 


ME: ms. 表示 差异 不 显著 (p > 0.1), p 值 经 簇 水 平 校正 
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第 一 次 重复 


音节 相关 音节 无 关 


S 
HW 
EN 
dB 
2.5 
4 0 0.2 0.4 0.6 0 0.2 0.4 0.6 
时 间 (ms) 时 间 (ms) 
音节 相关 RUE 音节 无 关 
-1.5 


频率 (Hz) 


0 0.2 0.4 0.6 0 0.2 0.4 0.6 
时 间 (ms) 时 间 (ms) 


图 3a FC4 点 音节 相关 和 无 关 条 件 的 事件 相关 频谱 扰动 
ik: 虚线 代表 图 片 出 现 的 时 间 , 黑色 方 框 表示 条 件 之 间 差 异 显 著 , p < 0.05, 经 簇 水 平 校正 


第 一 次 重复 


音素 相关 音素 无 关 


20 20 


= 

* 

EN 

dB 
2:5 
0 0.2 0.4 0.6 0 0.2 0.4 0.6 
时 间 (ms) 时 间 (ms) 
第 二 次 重复 
音素 相关 音素 无 关 

-1.5 


频率 (Hz) 


0 02 04 06 0 02 04 06 
时 间 (ms) 时 间 (ms) 


图 3b FC3 点 音素 相关 和 无 关 条 件 的 事件 相关 频谱 扰动 
注 : 虚线 代表 图 片 出 现 的 时 间 , 灰色 方 框 表示 条 件 之 间 差异 边缘 显著 , 0.05 < p < 0.1， 经 篮 水 平 校正 


1206 心 理 
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活动 在 音节 相关 与 音节 无 关 条 件 之 间 差 异 显著 ， 表 
现 为 音节 相关 条 件 下 个 体 9 频段 的 能 量 更 低 ， 音 素 
相关 条 件 与 音素 无 关 条 件 相 比 无 显著 差异 。 研 究 结 
果 表 明 , 汉语 口语 产生 过 程 中 , 8 频段 的 活动 反映 
了 个 体 对 音节 信息 的 加 工 。 

在 行为 层面 , 与 Zhang 和 Wang (2014) 的 研究 
结果 一 致 ， 由 于 试 次 重复 带 来 的 练习 效应 不 仅 总 体 


著 。 这 至 少 说 明 再 次 命名 时 ,被 试 的 行为 表现 更 倾 
向 于 音节 促进 效应 ， 而 非 音素 抑制 效应 ( 见 几 2)。 
在 神经 层面 , 我们 发 现 0 频段 的 神经 振荡 活动 
在 相关 类 型 与 相关 条 件 之 间 存 在 交互 作用 : 音节 相 
关 条 件 相 比 于 音节 无 关 条 件 , 个 体 9 频段 的 能 量 
低 。 更 重要 的 是 ， 音 节 效 应 发 生 在 刺激 出 现 后 大 约 
270-460 ms, 与 以 往 图 片 命 名 ERP 研究 中 音节 效 


降低 了 第 二 次 命名 的 反应 时 ,也 使 得 实验 关注 的 效 
应 消失 了 。 重 要 的 是 , 在 第 一 次 命名 时 ,本 研究 成 
功 重 复 了 以 往 利 用 内 隐 启 动 范 式 (Chen et al., 2002), 
图 词 干扰 范式 ( 珊 源 ， 张 清 芳 ,， 2015) 以 及 掩蔽 启动 
范式 (Chen et al., 2016) 发 现 的 音节 促进 效应 ; 同时 ， 
我 们 发 现 个 体 在 音素 相关 条 件 下 命名 潜伏 期 更 长 ， 
表现 出 音素 抑制 效应 (Chen et al., 2016)。 需 要 注意 
的 是 , 在 以 往 针对 字母 语言 的 研究 中 ,呈现 首 首 素 
相关 的 启动 刺激 会 降低 个 体 对 目标 刺激 的 命名 反 
应 时 (Alario et al., 2007; Damian & Bowers, 2003; 
Damian & Martin, 1999; Forster & Davis, 1991; 
Schiller, 2008)。 这 提示 我 们 字母 语言 和 汉语 的 口语 
产生 过 程 是 不 同 的 ， 具体 而 言 , 字母 语言 需要 在 音 
韵 编码 阶段 通过 加 工 刺 激 的 重音 、 音 素 等 信息 确定 
其 音节 结构 (Levelt et al., 1999); 而 汉语 的 音节 数量 


应 的 时 间 窗 口 一 致 (Cai, Yin, & Zhang, 2020; 
Dell’acqua et al., 2010; Wang et al., 2017; Yu et al., 
2014; Zhu, Damian, & Zhang, 2015)。 根 据 元 分 析 的 
结果 (Indefrey & Levelt, 2004), 个 体 通常 在 看 到 图 
片 之 后 的 250 ms 进入 音韵 编码 阶段 ， 此 时 汉语 母 
语 者 需要 提取 目标 词 的 音节 信息 并 为 后 续 加 工 做 
准备 。9 频段 的 能 量 在 音节 相关 条 件 下 比 无 关 条 件 
下 更 低 , 这 存在 两 种 可 能 的 解释 。 第 一 , 音节 重复 
导致 相同 音节 所 引起 的 能 量 活动 下 降 。GrillSpector, 
Henson fill Martin (2006) 指 出 , 个 体 在 加 工 重复 的 刺 
激 时 神经 元 活动 会 减弱 ， 而 这 种 去 激活 反应 表现 为 
神经 振荡 能 量 的 降低 。Gruber 和 Müller (2002) 在 客 
体 识别 的 任务 中 发 现 , 在 图 片 呈现 后 的 220-350 ms, 
重复 的 刺激 比 非 重复 的 刺激 诱发 了 更 低 的 Y 频 段 神 
经 振荡 能 量 。 采 用 任务 切换 范式 ,研究 者 发 现 当 被 


少 ， 音 节 边 界 清 晰 ,不 存在 重新 音节 化 的 特点 ， 这 
使 得 汉语 母语 者 在 音韵 编码 阶段 可 以 直接 提取 刺 
激 的 音节 信息 (O'Seaghdha et al., 2010)。 结 合 本 研 
究 的 反应 时 结果 来 看 , 个 体 表现 出 的 音节 促进 效应 
表明 汉语 口语 产生 中 音节 能 够 作为 独立 的 信息 表 
征 单元 ,在 音节 相关 条 件 下 通过 提前 加 工 目标 刺激 
的 音节 信息 降低 了 命名 反应 时 ; 而 音素 抑制 效应 很 
有 可 能 是 相同 首 音 素 的 音节 协同 激活 (co-activatiom) 
造成 的 竞争 导致 的 。 在 音素 相关 条 件 下 ， 由 于 启动 
刺激 与 目标 刺激 的 首 音 素 是 相同 的 ， 部 分 重合 的 信 
息 可 能 导致 以 该 音素 开头 的 音节 都 得 到 了 激活 ， 致 
使 个 体 在 提取 目标 词 的 音节 信息 时 , 受到 了 来 自 其 
他 音节 信息 的 干扰 ， 延 长 了 命名 反应 时 (后 文 将 结 
合 09 频 段 的 神经 振荡 活动 对 音素 抑制 效应 的 竞争 机 
制 展开 具体 讨论 )。 类 似 的, 在 一 项 针对 汉语 的 听觉 
词汇 判断 任务 中 ，Sereno 和 Lee (2015) 同 样 发 现 了 
音素 抑制 效应 。 尽 管 如 此 ， 相 比 于 音节 促进 效应 而 
言 ， 我 们 认为 本 研究 的 音素 抑制 效应 是 较为 微弱 
的 : 个 体 在 第 二 次 测试 时 没有 表现 出 显著 的 音节 促 
进 效 应 和 音素 抑制 效应 ， 但 相关 类 型 与 相关 条 件 的 
两 因素 交互 作用 依旧 是 显著 的 , 个 体 在 音节 相关 条 
件 下 命名 反应 时 更 快 ， 而 音素 条 件 之 间 差 异 并 不 显 


试 完 成 的 任务 前 后 保持 一 致 时 (重复 条 件 )， 相 比 不 
一 致 ( 非 重 复 条 件 ), B 与 y 的 能 量 显 著 下 降 (Gruber, 
Giabbiconi, Trujillobarreto, & Müller, 2006)。 刺 激 的 
重复 加 工 引 起 神经 振荡 能 量 减弱 这 一 结果 在 面孔 
识别 的 研究 中 也 得 到 了 重复 (Engell & Mccarthy, 
2014)。Brookes 等 (2005) 利 用 功能 磁 共 振 (functional 
magnetic resonance imaging, fMRI) 的 技术 ,发现 由 
重复 引起 的 神经 振荡 能 量 下 降 与 皮层 血 氧 依赖 水 
平 (blood oxygenation level dependent, BOLD)AY IE 
减 密切 相关 。 本 研究 中 , 音节 相关 条 件 下 启动 词 的 
音节 与 目标 图 名 称 首 字 的 音节 完全 一 致 ， 这 种 语音 
上 的 相似 性 极 有 可 能 引起 “重复 效应 ” 造成 6 频段 
能 量 活动 的 降低 。 第 二 ， 两 种 条 件 下 认 知 加 工 负荷 
的 差异 引起 了 能 量 的 变化 。 来 自 工作 记忆 的 研究 证 
据 表 明 , 对 于 认 知 加 工 负 蓓 较 重 的 任务 , 神经 元 释 
放 的 能 量 相 对 较 高 ， 而 认 知 加 工 负 和 荷 较 轻 的 任务 ， 
神经 元 释放 的 能 量 则 相对 较 低 (Roux & Uhlhaas, 
2014). 在 音节 相关 条 件 下 ， 由 于 对 目标 图 名 称 的 音 
节 信 息 进 行 了 提前 加 工 ， 当 被 试看 到 目标 刺激 并 提 
取 相 应 的 音节 进行 音韵 编码 时 ， 认 知 加 工 的 负荷 是 
相对 较 低 的 。 相 反 , 音节 无 关 条 件 下 ,被 试 无 法 通 
过 启动 刺激 直接 提取 目标 图 片 的 音节 信息 ， 认 知 加 


第 10 期 


AdE BBTII 


C hinaAX IVmT1FARHT! 


XE HE: 0 频段 (4~8 HZ) 的 活动 反映 了 汉语 口语 产生 中 音节 信息 的 加 工 1207 


工 负荷 相对 较 高 。 因 此 ， 对 比 音节 无 关 条 件 , 6 神经 
振荡 活动 的 能 量 在 音节 相关 条 件 下 会 更 弱 ， 这 与 行 
为 反应 时 的 模式 一 致 : 被 试 在 音节 相关 条 件 下 认 知 
负荷 更 低 , 命名 更 快 。 

需要 指出 的 是 , 在 言语 知觉 过 程 中 , 研究 者 比 
较 自然 的 语音 材料 和 逆序 播放 的 声音 刺激 时 ， 他 们 
发 现 了 在 自然 的 语音 材料 知觉 过 程 中 引发 了 更 高 
的 6 频段 能 量 活 动 , 这 与 本 研究 发 现 的 模式 不 一 
致 。 这 是 由 于 比较 条 件 的 不 同 引起 的 : Peña 和 
Melloni (2012) 以 及 Ding 等 (2015) 的 研究 发 现在 言 
语 知觉 过 程 中 ， 当 被 试听 逆序 播放 的 材料 时 ， 相 比 
于 正 序 播放 的 条 件 , 9 频段 的 活动 能 量 更 低 。 研 究 者 
认为 道 序 播放 破坏 了 语言 本 身 正 常 的 语音 结构 ， 人 
们 不 能 识别 材料 中 的 音节 ， 相 应 皮层 的 神经 元 活动 
处 于 抑制 状态 ,其 神经 振荡 的 能 量 相对 较 低 。 在 正 
序 播放 材料 的 情况 下 ,被 试 能 够 顺利 地 加 工 材 料 的 
音节 信息 ， 相 应 皮层 的 神经 活动 处 于 兴奋 状态 , 其 
神经 振荡 的 能 量 相对 较 高 。 我 们 研究 中 比较 的 是 音 
节 相 关 与 无 关 ， 是 两 类 兴奋 状态 下 的 比较 ,而 言语 
知觉 研究 中 比较 的 是 兴奋 状态 和 非 兴 奋 状 态 , 因此 
产生 了 不 同 的 模式 。 

与 音节 效应 相 比 , 在 340~390 ms 的 时 间 窗 内 ， 
我 们 发 现 了 音素 相关 条 件 与 音素 无 关 的 能 量 差异 
(边缘 显著 水 平 ), 表现 为 第 一 次 重复 时 音素 相关 条 
件 下 9 频段 能 量 活动 高 于 音素 无 关 条 件 ， 其 能 量 } 
动 模式 与 音节 相关 条 件 下 不 同 。 当 启动 词 和 目标 图 
名 称 存在 音素 相关 时 ， 二 者 享有 相同 的 首 音素 ( 启 
动词 : 柏 /bai3/, 目标 图 : 盘子 /bi2//zi5/), 在 加 工 过 
程 中 首 音素 的 重 闪 激活 了 以 该 音素 开头 的 所 有 音 
节 ( 如 : /ba/, /bang/ 等 ), 对 目标 音节 的 产生 造成 了 苋 
F, 表现 为 9 频段 的 能 量 活动 在 音素 相关 条 件 与 音 
素 无 关 条 件 对 比 时 更 强 。 这 与 Chen 等 (2016) 的 发 现 
一 致 ， 他 们 采用 与 本 研究 完全 相同 的 实验 设计 和 任 
务 ， 发 现 音 素 相关 与 无 关 条 件 相 比 出 现 了 微弱 的 抑 
制 效 应 。 

在 汉语 口语 词汇 产生 中 ,音节 效应 9 频段 能 量 
变化 的 时 间 早 于 音素 效应 , 与 已 有 人 研究 中 相关 效应 
的 时 间 进 程 一 致 ， 从 能 量变 化 的 角度 为 “音节 是 音 
韵 编码 的 合适 单元 ”提供 了 证 据 。 例 如 ，Feng，Yue 
和 Zhang (2019) 采 用 图 画 - 词 汇 干 扰 任 务 ， 操 纵 了 
干扰 词 与 目标 图 名 称 之 间 的 相关 关系 ,发 现 音节 相 
关 效 应 出 现在 图 画 呈 现 后 的 320 ms 左右 , 音素 相 
关 效 应 在 368 ms 左右 , KPNI RAE T 
编码 阶段 ,在 Zhang 和 Damian (2019) 的 研究 中 ， 除 


了 发 生 在 300-400 ms 的 音节 效应 ， 研 究 者 还 探测 
到 了 音素 效应 : 在 目标 图 呈现 后 的 500-600 ms， 音 
素 相关 条 件 比 音素 无 关 条 件 诱发 了 更 小 的 ERP 波 
幅 。 

虽然 目前 没有 研究 者 利用 脑 电 技术 直接 对 比 
印 欧 语 母语 者 音素 效应 与 音节 效应 的 时 间 进 程 ,但 
研究 者 对 于 音节 频率 效应 (syllable frequency effect) 
的 研究 也 许 能 提供 部 分 的 证 据 。 音 节 频 率 效应 是 指 
个 体 在 语言 产生 过 程 中 对 使 用 频次 较 高 的 音节 加 
工 速度 更 快 ， 反 应 时 更 短 ,， 该 效应 与 音节 水 平 的 加 
工 密切 相关 (Levelt et al., 1999)。 利 用 ERP 反应 锁 
Ff (response locked) 的 分 析 方 法 , Burki, Cheneval 和 
Laganaro (2015) 发 现 音节 频率 效应 出 现在 被 试 出 声 
命名 前 的 180~150 ms 之 间 , 该 时 间 窗 正好 对 应 口 
语 产 生 的 语音 编码 阶段 。DellPAcqua 等 (2010) 通 过 
对 比 意大利 母语 者 口语 产生 过 程 中 的 语义 效应 和 
语音 效应 ,发现 首 音素 重合 引发 的 促进 效应 发 生 在 
刺激 出 现 后 的 250-400 ms 之 间 ， 即 音韵 编码 阶段 
(Indefrey & Levelt, 2004)。 以 上 的 两 个 研究 在 脑 电 
时 间 进 程 上 为 字母 语言 先 加 工 音 素 后 加 工 音节 提 
供 了 间接 证 据 。 相 比 而 言 , 我 们 发 现 的 汉语 口语 词 
汇 产 生 中 能 量变 化 上 的 先后 关系 为 音节 效应 在 前 ， 
音素 效应 在 后 。 汉语 和 印 欧 语系 中 音节 和 音素 的 提 
取 在 时 间 进 程 上 表现 出 完全 相反 的 模式 。 上 述 对 比 
表明 不 同 的 语言 ,音韵 编码 中 首先 提取 的 单元 不 同 ， 
与 “合适 单元 假说 ”的 跨 语言 假设 一 致 (O'Seaghdha 
et al., 2010)。 

音节 相关 条 件 缩短 图 画 命名 时 间 ,， 引起 6 频段 
能 量 的 减弱 ， 而 音素 相关 条 件 可 能 会 延长 图 画 命名 
时 间 , 引 起 6 频段 能 量 的 增强 。 本 研究 和 言语 知觉 
的 结果 都 表明 无 论 是 语言 理解 任务 还 是 语言 产生 
任务 , 0 频段 的 能 量 活动 与 音节 的 加 工 相 关 。 尽 管 如 
此 , 研究 中 微弱 的 处 于 边缘 显著 水 平 的 音素 效应 提 
zm 0 频段 的 能 量 活动 可 能 和 语音 加 工 相 关 。 第 二 次 
重复 时 在 反应 时 上 音节 和 音素 效应 都 消失 ,这 与 已 
有 的 研究 一 致 (Chen et al., 2016), 本 研究 的 时 频 结 
果 与 反应 时 结果 一 致 ,表明 人 类 的 大 脑 能 够 迅速 对 
加 工 过 的 刺激 作出 反应 。 下 一 步 的 研究 中 可 以 采用 
英语 作为 目标 语言 考察 在 行为 结果 上 出 现 显 车 的 
音素 效应 时 , 9 频段 的 能 量 活动 是 否 在 相关 条 件 和 
无 关 条 件 下 存在 差异 ,进行 跨 语言 之 间 的 对 比 , SE 
入 考察 6 频段 的 能 量 活动 的 认 知 涵义 。 

需要 注意 的 是 , 虽然 传统 的 ERP 分 析 方 法 在 
时 间 进 程 上 区 分 了 音节 和 音素 的 加 工 顺序 , 但 ERP 
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的 幅 值 在 不 同 研 究 中 表现 出 了 完全 相反 的 模式 : 与 
Zhang 和 Damian (2019) 的 结果 不 同 , Dell’ Acqua 等 
(2010) 发 现 语 音 相关 条 件 比 语音 无 关 条 件 诱发 了 被 
试 更 大 的 ERP 波幅 。 与 语义 违反 的 “N400 效应 ” 存 
在 矛盾 的 实验 结果 类 似 (van Petten & Luka, 2012), 
ERP 波形 方向 和 波幅 大 小 在 实验 间 的 不 一 致使 研 
究 者 很 难 进一步 解释 语言 加 工 的 脑 机 制 。 即 使 ERP 
的 结果 表现 出 较 高 的 跨 实 验 一 致 性 ,由 于 差异 波 并 
不 与 特定 的 认 知 加 工 过 程 对 应 , 我 们 仍然 无 法 将 条 
件 之 间 不 同 的 ERP 模式 完全 归 因 于 口语 产生 过 程 
中 加 工 机 制 的 不 同 。 例 如 , 在 Wang 等 (2017) 的 研究 
中 ,音节 相关 条 件 在 刺激 属性 上 重 秋 度 相对 较 大 
(剪刀 /iian3daol/ 一 键盘 /iian4pan2/)， 音 素 相 关 条 
件 在 刺激 属性 上 重生 度 相对 较 小 (西瓜 /xilgual/ 一 
信封 /xin4feng1/)， 被 试 进行 图 片 命名 时 ,完全 有 可 
能 在 阅 下 水 平 探测 到 了 不 同 实 验 条 件 之 间 重 释 度 
的 差异 ， 因 此 音节 相关 条 件 与 音节 无 关 条 件 对 比 时 
差异 更 大 ,而 音素 相关 条 件 与 音素 无 关 条 件 对 比 时 
差异 更 小 ,甚至 消失 。 虽 然 本 研究 在 实验 条 件 的 设 
置 上 与 前 人 研究 类 似 , 但 时 频 分 析 是 对 不 同时 间 点 ， 
不 同 频率 区 间 能 量 大 小 的 计算 , 这 一 指标 直接 反映 
了 不 同 活动 速率 的 神经 元 激活 /抑制 情况 (Cohen,， 
2017). 对 于 本 研究 而 言 ， 我 们 没有 发 现 3~30 Hz 区 
间 内 其 他 频段 的 能 量 活动 在 音节 相关 条 件 与 音素 
相关 条 件 之 间 存 在 显著 差异 ， 表 明 音 节 相 关 和 音素 
相关 两 种 条 件 之 间 存 在 的 重 公 度 差 异 并 没有 混淆 
实验 的 主要 结果 。 而 且 , 相 比 音节 无 关 条 件 , 个 体 
在 音节 相关 条 件 下 0 频段 的 活动 能 量 更 低 ; 但 对 音 
素 而 言 ， 相 关 条 件 下 9 频段 的 活动 能 量 有 升 高 的 趋 
势 。 这 种 实验 条 件 之 间 相 反 的 神经 振荡 模式 反映 的 
是 个 体 在 口语 产生 过 程 中 对 音节 和 音素 的 加 工 存 
在 不 同 的 认 知 神经 机 制 。 

综 上 ,我 们 认为 汉语 口语 产生 中 0 频段 的 活动 
反映 了 对 音节 的 加 工 ， 从 频段 能 量变 化 的 角度 为 音 
节 是 汉语 口语 词汇 产生 中 音韵 编码 的 单元 提供 了 
支持 证 据 。 我 们 的 研究 也 表明 人 类 的 语言 理解 和 语 
言 产生 过 程 在 神经 振荡 上 引发 了 相同 的 能 量 活动 
变化 。 未 来 还 需 结 合 不 同 的 实验 范式 ， 进 一 步 探索 汉 
语 口语 产生 中 各 个 频段 能 量 活动 的 认 知 意义 。 
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Abstract 


Languages may differ in the proximate units of phonological encoding in spoken word production. It has 


been demonstrated that syllables are proximate units of phonological encoding in Chinese speech production. 


Previous studies report that the 0 band oscillations has been associated with syllables processing in language 


comprehension, however, it remains unknown what are the neural oscillations for syllables retrieval in speech 


production. The present study aims to investigate the neural oscillations of syllables retrieval at the stage of 


phonological encoding in Chinese spoken word production. 


We employed a masked priming paradigm and electrophysiological signals were recorded concurrently. In 


the task, participants were instructed to name pictures with disyllabic words which were preceded by briefly 


presented and masked prime words. Prime words were syllabically or phonemically related to the first syllable 


of targets or were unrelated, and the experimental design includes prime type (syllable vs. phoneme), relatedness 
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(related vs. unrelated), and repetition (first vs. second). 

Behavioral data analysis showed a significant triple interaction among prime type, relatedness and 
repetition. In the first repetition, naming latencies were faster in syllabically related than unrelated condition, 
whereas latencies were longer in the phonemically related than unrelated condition. Time-frequency analysis 
also showed a significant interaction between prime type and relatedness in the time window of 300-600 ms 
after pictures onset. Specifically, theta band power was lower for syllabically related than unrelated while no 
significant differences between phonemically related and unrelated. Cluster based permutation test showed that, 
in the first repetition, syllabically related condition elicited lower 0 band power than unrelated in the time 
window of 270-460 ms, while phoneme relatedness produced marginally higher 0 band power than phoneme 
unrelatedness in the 340-390 ms time window. These effects were absent in the second repetition. 

In sum, we found that syllable priming effect was reflected by the decrease of 0 oscillation in spoken word 
production in Chinese. Time-frequency analysis also revealed an early syllable priming effect, and a late 
phonemic inhibition effect in Chinese spoken word production, which provides evidence for the proximate units 
principle. 
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